AI Inference时代的新记忆体需求

摘要

2026年1月NVIDIA发表由BlueField-4 DPU管理的CMX情境记忆储存平台(CMX Context Memory Storage Platform),扩展Local SSD、Share Storage之间的记忆体阶层,以因应在AI Inference时代庞大的KV Cache储存需求。此外,NVIDIA、Arm接连推出CPU机柜以因应Agentic AI的CPU需求,也创造CPU RAM的增量市场。

本篇报告主要深度解析:(1) AI Inference的记忆体需求;(2) KV Cache Offloading带动的SSD POD需求;(3) Agentic AI带动的CPU RAM需求。期能解析AI Inference时代记忆体容量需求膨胀原因、现有解决方案与未来新记忆体需求结构。

一. AI Inference的记忆体需求
二. KV Cache Offloading带动的SSD POD需求
三. Agentic AI带动的CPU记忆体需求
四. 拓墣观点

图一 2023~2026年AI Models Average Output Tokens per Question
图二 KV Cache应用范例
图三 Agentic AI应用的CPU:GPU比例变化
图四 NVIDIA Dynamo KV Cache Offloading顺序(G1~G4)
图五 NVIDIA Vera CPU架构
图六 2026年NVIDIA CPU需求量情境分析结果

表一 2023~2026年各厂商CPU记忆体规格
表二 2026年NVIDIA CPU出货量情境分析假设
表三 AI Inference带动的记忆体需求动能汇整

 

AI Inference时代的新记忆体需求

请输入您的会员账号与密码,即可浏览全文

Login 如何购买 下载完整报告档案 1.26MB PDF

会员专属
您好,该资料属会员权益方可浏览,您需成为会员且购买此产业项目权限才可观看,详细说明如下:
  • 拓墣产业研究院之「产业数据库」为付费的会员服务,若您尚未具备会员身份,欢迎您申请加入或是与我们的客服联络了解。
  • 若您所属公司机关已具有拓墣会员身份,并且设定予贵公司人员在线申请,请先行移至「申请会员账号」填写申请数据后送出,我们会尽快为您审核办理。若未开放在线申请,请您询问贵公司的承办联系人处理,谢谢。
  • 由于贵公司无采购此产业项目,因此您将无法浏览此篇文章,欲查询贵公司所购买的产业项目明细,请至「会员权益」查询,谢谢。
  • 客户服务专线: 02 8978-6498 ext.822
    客户服务信箱:

宣传推广

产业洞察

光互连成AI Factory扩张关键,预估2030年CPO/NPO市场规模将破390亿美元

根据TrendForce最新矽光子产业研究,随著AI训练与推论需求快速扩张,AI 资料中心 [...]

AI续强、消费供应链提前备货发酵,第一季全球前十大晶圆代工营收季增3.7%

根据TrendForce最新晶圆代工产业研究,除了AI HPC与相关周边订单仍如火如荼出货 [...]

NVIDIA下调Vera CPU搭载容量,凸显LPDRAM供给缺口难弭平与中长期需求上扬趋势

根据全球市场研究机构集邦科技TrendForce调研结果指出,NVIDIA决议将次世代Ve [...]

第一季全球智慧手机生产总数年减1.7%,记忆体成本压力将使第二季出现较明显衰退

根据TrendForce最新研究显示,2026年第一季全球智慧手机生产总数约2.84亿支, [...]